こんにちは、Google の AI「Gemini(ジェミニ)」の公式 note 編集部です。
この記事ではGoogle の AI、Gemini に対するみなさんの疑問に答えていきたいと思っています!
"Gemini" という名称で AI モデルやサービスが複数あるけど、違いは何? 有料版 / 無料版はどう選べばよい?アプリはあるの? などなど。
誰でもすぐに使える会話インターフェースの Gemini(gemini.google.com)の紹介を中心に、企業や開発者向けサービスの展開、すべての基盤となる Gemini モデルの話まで全体像を解説します。この記事を通じて、Google の AI「Gemini」をもっと知って、みなさんの役に立てていただけるようまとめました。
※この記事は随時更新します(最終更新 2024 年 6 月 19 日)。
Google の AI、Gemini(ジェミニ)って何?Google の AI「Gemini(ジェミニ)」は、Google が開発・提供している生成 AI です。データを学習して新たなコンテンツを生み出せる生成 AI は、ここ数年で世の中に浸透し、ビジネス、趣味など幅広く活用されるようになりました。
また、複数の形式のデータ(モダリティと呼びます)に対応することで、より多彩なタスクを処理できる生成 AI をマルチモーダル モデルと呼びます。
Gemini もそんな マルチモーダル モデルの生成 AI のひとつで、画像や動画、テキストなどを一緒に処理できるので、例えばクッキーの写真とともに「このクッキーのレシピを教えてください」とプロンプトを入力して、レシピを出力させるようなことが可能です。2023 年末に提供を開始して以来、さまざまなシーンに対応したサービスを展開してきています。
会話インターフェースの Gemini はアクセスも簡単!
アクセス方法は、ウェブ版(gemini.google.com)以外にアプリもあります。Android スマホの Gemini アプリまたは Google アシスタント、iOS の Google アプリからアクセスできますので、身近な方法で Gemini に話しかけてみてください。
Gemini の無料プラン / 有料プラン会話インターフェースのGemini には 2 種類があります。それが誰でも簡単に利用可能な無料版「Gemini」と、よりリッチな Gemini 体験が可能な有料版「Gemini Advanced」。
まず、Google アカウントを持っていれば誰でも利用可能な無料版でもできることや主な特徴は
「回答を再確認」から、出力された回答を裏付ける情報がウェブ上に存在するかどうかをダブルチェックできる
画像で指示を出したり、画像付きで直感的な回答をもらえたりする
3 つの回答案が用意され、文章のスタイルも調整可能
Gmail、Google Sheets などのサービスにエクスポートできる
Google マップや YouTube などの Google サービスと連携している
この特徴によって、Gemini に話しかけてアイデアを広げたり、メールの下書きや添削をしてもらったり、プログラム コードのデバックを頼んだり、無料版でもさまざまなシーンで活用いただけます。
ただ、より複雑なタスクをお願いしたい場合や、大きなデータを扱いたい場合は、Google の最上位 AI モデル 1.5 Pro 搭載の Gemini Advanced がおすすめです。
Google 最上位モデル搭載 & 業界最長の 100 万トークン約 1,500 ページの書類、100 件のメール相当の処理が可能
テキスト・画像・動画含むマルチモーダルなデータ処理画像・テキストに加え、間もなく、動画やコードベースの処理も可能に
複数のファイルからのデータ分析・グラフ作成 複数の PDF や書類、スプレッドシートからの分析やグラフ作成が可能
これらの Gemini Advanced 機能は「Google One AI プレミアム」プランに加入すると利用できます。
Gemini とできること長い文章の要約・分析、メール・挨拶のドラフト、アイデア出し・壁打ち相手、情報収集・プランニング、プログラミング・学習・就活のサポート… Gemini とできることはたくさんあります!
例えば、外国のニュース記事を短時間で理解できるよう翻訳してもらったり、新商品のキャッチコピーを考えてもらったり、旅行プランを組んでくれたり、みなさんの創造力を引き出し、生産性を高めるサポートができます。
他にはこんな使い方も!
ユースケース例 1(Gemini)アイデア出しプロンプト「あなたは人気の動画クリエイターです。斬新な大人の夏休み自由研究をテーマに斬新で面白い動画企画案を考えて。「企画名」「企画の詳細」「面白いポイント」「工夫ポイント」を軸に、表でまとめて」→ Gemini との会話の全貌はこちら
さらに Gemini Advanced なら、こんな活用方法もあります。ぜひ、みなさんのアイデアでたくさん使ってみてくださいね。
ユースケース例 2(Gemini Advanced)ゲームプロンプト「国名当てクイズの出題者になって。その国の特徴を絵文字 3 つだけ使って 5 問出題して」→ Gemini との会話の全貌はこちら
基盤となる 4 つの Gemini モデルと開発ストーリーこんなふうに、"Gemini" という名称はさまざまな場所で使われていますが、その裏側には共通基盤の Gemini モデルがあります。
でも、AI が使われる状況はひとつではありません。時間がかかっても良いので複雑なタスクを正確に実行したい場合。短時間に素早く応答することが重要な場合。ネット接続がない環境で使われる場合など。あらゆる状況に対応するために、4 つの Gemini モデルを用意しています。
Gemini 1.0 Ultra: Gemini シリーズで最もサイズが大きく、複雑なタスクを解くことに適したモデル
Gemini 1.0 / 1.5 Pro: 幅広いタスクに対応でき、一般的なパフォーマンスに最適なモデル
Gemini 1.5 Flash: 軽量、高速、コスト効率に優れた最新モデル
Gemini Nano: データ ネットワークの有無にかかわらず、デバイス上で迅速な応答を提供するように最適化されたモデル
中でも、Gemini 1.5 Pro は、最大 200 万トークンというロング コンテキスト ウィンドウを備えています。ひとつ前の世代の Gemini モデルや、他の AI モデルのコンテクストサイズは数万から数十万でした。それが何倍にもなることで、よりたくさんの情報を知って、より長い文脈を踏まえたうえで、回答を生成できるようになっています!
注: 2024年6月現在、開発者向けには、200万トークンまで拡張していますが、コンシューマ向けの Gemini 有料版 Gemini Advanced では、最大100万トークンになります。
出典:https://deepmind.google/technologies/gemini/そして、これら Gemini モデルのプロジェクトを率いる組織が、Google DeepMind です。
過去 10 年にわたって別々に AI 研究を続けてきた、DeepMind と Google Brain という 2 つのチームが 2023 年 4 月に合併して誕生しました。2 チームが(双子のように)ともに開発にあたっています。ラテン語で双子を意味する "Gemini" という名前には、こんな開発ストーリーも込められています。
Gemini モデルの基盤の上に、さまざまなサービスがあり、Gemini エコシステムを形作っています。コンシューマ向けには、上記説明した会話インターフェースの Gemini (gemini.google.com) および Gemini モバイルアプリを展開しています。ビジネス・企業向けには、複雑なシステム構築を必要とせずにそのまま企業のみなさまにご利用いただける、「Gemini for Google Workspace(Gemini Business および Gemini Enterprise プラン)」を展開しており、データがモデルの学習トレーニングに使用されることなく、エンタープライズ グレードのセキュリティを実現しているのが特徴です。デベロッパー向けには、個人開発者向けツール「Google AI Studio」、企業向け AI プラットフォーム「Vertex AI」があり、無料ベースの Google AI Studio からプロトタイプを開発し、いつでも Vertex AI へ移行できます。また、入力データは、Google が利用することはないと、規約とアーキテクチャ両面で保証されています。
Gemini の進化をお楽しみに!Google は 2023 年 5 月に開催した「Google I/O 2023」で、「AI をすべての人にとって役立つものにする(Making AI helpful for everyone)」というミッションを掲げ、Bard の日本語対応をいち早く実現しました。
それから 1 年後、Bard は Gemini に生まれ変わり、グッと進化しました。lmsys.org による評価では、2024 年 6 月 17 日時点の Gemini 1.5 Pro が日本語でトップ (同率 1 位含む)です。
でも、ここで立ち止まらずに、さらなる使いやすさのためにロング インプット & アウトプットに最適なチューニングを続けていきます。2024 年後半に向けて、まずは「Google I/O 2024」で発表した Ask Photos などの新機能が順次登場する予定ですので、またこの記事で紹介しますね。
そして何よりも、みなさんの利用が Gemini モデルの改善につながっていきます。
Gemini を使っていただいて「ここがよかった」「この使い方がうまくいかなかった」「もっとこうしてほしい!」があれば、聞かせていただきたいと思っています。ぜひ最新の Gemini をビジネスに、趣味に、幅広く活用して、プロダクト上の 👍👎でフィードバックをお願いします!